Student-t hypotesetest av gjennomsnitt
Hvis vi skal gjøre hypotesetester på gjennomsnittet til et utvalg så støter vi fort på problemer hvis utvalget vårt
Istedenfor å bruke normalfordeling bruker vi derfor en annen fordeling: student-t fordelingen. Den ligner på normalfordelingen, men vi er her nødt til å ta hensyn til antall frihetsgrader
For å gjennomføre en hypotesetest forventningsverdien til
- Sette opp nullhypotese og alternativ hypotese
- Samle inn observasjoner
- Finne gjennomsnittet til observasjonene
- Finne variansen,
til observasjonene ved å summere kvadratavvikene og dividere på antallet observasjoner . - Beregne standardavviket
- Beregne
-verdien: - Bruke statistisk programvare til å beregne
# venstresidig test. H_a: mu er mindre enn mu_0
from scipy.stats import t
import numpy as np
mu_0 = 15
obs = [220, 205, 209, 256, 214]
df = len(obs) # antall frihetsgrader = n - 1
x_strek = np.average(obs) # beregne gjennomsnitt
SF = np.std(obs, ddof=1) # beregne standardavvik
# med n-1 frihetsgrader
t_obs = (x_strek - mu_0) / SF
P = t.cdf(t_obs, df) # bruker den kumulative sannsyn-
# lighetsfordelingen til å bestemme
# for observasjonene våre kan skje
# gitt at H_0 er sann
# for å visualisere testobservator fra forrige test
import matplotlib.pyplot as plt
from scipy.stats import t
import numpy as np
x = np.linspace(-5,5,1000)
T = t.pdf(x, df=df)
plt.plot(x,T)
femprosent = t.ppf(0.05, df=df)
nittifemprosent = t.ppf(0.95, df=df)
plt.vlines(femprosent,0,max(T), color="red", label="95% persentil")
plt.vlines(femprosent,0,max(T), color="red", label="95% persentil")
plt.vlines(t_obs,0,max(T), color="magenta", label="t_observator")
plt.legend()
Merk: dette er den enkle måten å beregne antall frihetsgrader når du kun skal gjøre hypotesetest på
i ett utvalg. ↩︎